clear
set more off


// SINGLES DISTRIBUTION IN 2001 FOR STRUCTURAL ESTIMATION   


use "$data\census2001.dta" , clear

label define gender 1 "maschio" 2 "femmina"
label define codici_province 001 "Torino" 002 "Vercelli" 003 "Novara" 004 "Cuneo" 005 "Asti" 006 "Alessandria" 096 "Biella" 103 "Verbano-Cusio-Ossola" ///
007 "Valle D'Aosta/Valle d'Aoste" 012 "Varese" 013 "Como" 014 "Sondrio" 015 "Milano" 016 "Bergamo" 017 "Brescia" 018 "Pavia" 019 "Cremona" 020 "Mantova" 097 "Lecco" 098 "Lodi" 108 ///
"Monza e della Brianza" 021 "Bolzano/Bozen" 022 "Trento" 023 "Verona" 024 "Vicenza" 025 "Belluno" 026 "Treviso" 027 "Venezia" 028 "Padova" 029 "Rovigo" 030 "Udine" 031 "Gorizia" ///
032 "Trieste" 093 "Pordenone" 008 "Imperia" 009 "Savona" 010 "Genova" 011 "La Spezia" 033 "Piacenza" 034 "Parma" 035 "Reggio nell'Emilia" 036 "Modena" 037 "Bologna" 038 "Ferrara" ///
039 "Ravenna" 040 "Forl-Cesena" 099 "Rimini" 045 "Massa-Carrara" 046 "Lucca" 047 "Pistoia" 048 "Firenze" 049 "Livorno" 050 "Pisa" 051 "Arezzo" 052 "Siena" 053 "Grosseto" 100 "Prato" ///
054	"Perugia" 055 "Terni" 041 "Pesaro e Urbino" 042	"Ancona" 043	"Macerata" 044	"Ascoli Piceno" 109	"Fermo" 056	"Viterbo" 057	"Rieti" 058	"Roma" 059	"Latina" 060 "Frosinone" ///
066	"L'Aquila" 067	"Teramo" 068	"Pescara" 069	"Chieti" 070	"Campobasso" 094	"Isernia" 061	"Caserta" 062	"Benevento" 063	"Napoli" 064	"Avellino" 065	"Salerno" ///
071 "Foggia" 072	"Bari" 073	"Taranto" 074	"Brindisi" 075	"Lecce" 110	"Barletta-Andria-Trani" 076	"Potenza" 077	"Matera" 078	"Cosenza" 079	"Catanzaro" ///
080	"Reggio di Calabria" 101	"Crotone" 102	"Vibo Valentia" 081	"Trapani" 082	"Palermo" 083	"Messina" 084	"Agrigento" 085	"Caltanissetta" 086	"Enna" 087	"Catania" ///
088	"Ragusa" 089	"Siracusa" 090	"Sassari" 091	"Nuoro" 092	"Cagliari" 095	"Oristano" 104	"Olbia-Tempio" 105	"Ogliastra" 106	"Medio Campidano" 107	"Carbonia-Iglesias"

label define cittadinanza 000 "nullo" 100 "Italiana"  201 "Albania"   202	"Andorra" 203 "Austria" 206	"Belgio" 209 "Bulgaria" 210 "Ex-cecoslovacchia" 212	"Danimarca" 214	"Finlandia" 215	"Francia" 216 "Germania" 219 "Regno Unito" ///	
220	"Grecia" 221 "Irlanda" 223 "Islanda" 225 "Liechtenstein" 226 "Lussemburgo" 227	"Malta" 229	"Monaco" 231 "Norvegia" 232	"Paesi Bassi" 233 "Polonia" 234	"Portogallo" ///	
235	"Romania" 236 "San Marino" 239	"Spagna" 240 "Svezia" 241 "Svizzera" 243 "Ucraina" 244	"Ungheria" 245	"Russa,Federazione" 246	"Santa Sede" 247 "Estonia" 248 "Lettonia" ///
249	"Lituania" 250 "Croazia" 251 "Slovenia" 252	"Bosnia-Erzegovina" 253	"Macedonia,ex Repubblica Jugoslava di" 254 "Moldova" 255 "Slovacchia" 256 "Bielorussia" 257	"Ceca,Repubblica" ///	
270	"Montenegro" 271 "Serbia, Repubblica di" 301 "Afghanistan" 302 "Arabia Saudita" 304	"Bahrein" 305 "Bangladesh" 306 "Bhutan" 307	"Myanmar (ex Birmania)" 309	"Brunei" ///
310	"Cambogia" 311 "Sri Lanka (ex Ceylon)" 314	"Cinese, Repubblica Popolare" 315 "Cipro" 319 "Corea, Repubblica Popolare Democratica (Corea del Nord)" ///
320	"Corea, Repubblica (Corea del Sud)"  322	"Emirati Arabi Uniti" 323	"Filippine" 324	"Territori dell'Autonomia Palestinese" 	326	"Giappone" 	327	"Giordania" 330	"India" ///	
331	"Indonesia" 332	"Iran, Repubblica Islamica del" 333	"Iraq" 334	"Israele" 335 "Kuwait" 336 "Laos"  337 "Libano" 338 "Timor Orientale" 339 "Maldive" 340 "Malaysia" 341 "Mongolia" ///	
342	"Nepal" 343	"Oman" 344 "Pakistan" 345 "Qatar" 346	"Singapore" 348	"Siria" 349	"Thailandia" 351 "Turchia" 353 "Vietnam" 354 "Yemen" 356 "Kazakhstan" 357 "Uzbekistan" ///	
358	"Armenia" 359 "Azerbaigian" 360	"Georgia" 361 "Kirghizistan" 362 "Tagikistan" 363 "Taiwan (ex Formosa)" 364	"Turkmenistan" 401 "Algeria" 402 "Angola" 404 "Costa d'Avorio" ///	
406	"Benin (ex Dahomey)" 408 "Botswana" 409	"Burkina Faso (ex Alto Volta)" 410	"Burundi" 411 "Camerun" 413	"Capo Verde" 414 "Centrafricana, Repubblica" 415 "Ciad" 417	"Comore" ///	
418	"Congo (Repubblica del)" 419 "Egitto" 420 "Etiopia"  421	"Gabon" 422	"Gambia" 423 "Ghana" 424 "Gibuti" 425 "Guinea" 426 "GuineaBissau" 427 "Guinea Equatoriale" 428	"Kenya" ///	
429	"Lesotho" 430	"Liberia" 431 "Libia" 432 "Madagascar" 434	"Malawi" 435 "Mali" 436	"Marocco"  437	"Mauritania" 438 "Mauritius" 440 "Mozambico" 441 "Namibia" 442	"Niger" ///	
443	"Nigeria" 446 "Ruanda" 448	"San tome e Principe" 449 "Seychelles" 450	"Senegal" 451 "Sierra Leone" 453 "Somalia" 454	"Sud Africa" 455 "Sudan" 456 "Swaziland" 457 "Tanzania" ///	
458	"Togo" 460	"Tunisia" 461 "Uganda" 463	"Congo, Repubblica democratica del (ex Zaire)"  464 "Zambia" 465	"Zimbabwe (ex Rhodesia)" 466 "Eritrea" 503 "Antigua e Barbuda" ///	
505	"Bahamas" 506 "Barbados" 507 "Belize" 509 "Canada" 513	"Costa Rica" 514 "Cuba" 515	"Dominica" 516	"Dominicana, Repubblica" 517 "El Salvador" 518	"Giamaica" 519 "Grenada" ///	
523	"Guatemala" 524	"Haiti" 525	"Honduras" 527	"Messico" 529 "Nicaragua" 530 "Panama" 532	"Saint Lucia" 533 "Saint Vincent e Grenadine" 534 "Saint Kitts e Nevis" ///
536	"Stati Uniti d'America" 602	"Argentina"  604	"Bolivia" 605	"Brasile" 606 "Cile" 608 "Colombia" 609	"Ecuador" 612 "Guyana" 614	"Paraguay" 615	"Peru" 16 "Suriname" ///	
617	"Trinidad e Tobago" 618	"Uruguay" 619 "Venezuela" 701 "Australia" 703 "Figi" 708 "Kiribati" 712	"Marshall, Isole" 713 "Micronesia, Stati Federati" 715 "Nauru" 719 "Nuova Zelanda" ///	
720	"Palau" 721	"Papua Nuova Guinea" 725 "Salomone, Isole" 727	"Samoa" 730	"Tonga" 731	"Tuvalu" 732 "Vanuatu" 999 "APOLIDE" 888 "altro" 777 "non indicato"
label define codici_regioni  1 "Piemonte" 2 "Valle D'Aosta" 3 "Lombardia" 4 "Trentino Alto-Adige" 5 "Veneto" 6 "Friuli Venezia Giulia" 7 "Liguria" 8 "Emilia Romagna" ///
9 "Toscana" 10 "Umbria" 11 "Marche" 12 "Lazio" 13 "Abruzzo" 14 "Molise" 15 "Campania" 16 "Puglia" 17 "Basilicata" 18 "Calabria" 19 "Sicilia" 20 "Sardegna" 
lab define relationl 1 "Intestatario del foglio di famiglia"   2 "Coniuge dell'intestario"     3 "Convivente dell'intestatario"     4 "Figlio/a"  5 "Figlio/a"   6 "Figlio/a"    7 "Genitore (o coniuge del genitore)"    8 "Suocero/a" ///    
                     9 "Fratello/sorella" 10 "Fratello/sorella"    11 "Coniuge del fratello/sorella"     12 "Genero/nuora"   13 "Nipote (figlio/a di un figlio/a)"   14 "Nipote"    15 "Altro parente dell'intestatario"    16 "Altra persona convivente senza legami di parentela" 


rename codpro provincia
lab values provincia codici_province
rename codcom cod_mun
lab var cod_mun "codice comune"
rename progfam idf
lab var idf "identificativo famiglia"
rename progper idc
lab var idc "identificativo individui per comune"
rename relpar relation
lab var relation "relazioen di parentela"
lab values relation relationl
rename sesso sex 
lab values sex gender 
rename gnas born_d
rename mnas born_m 
rename anas born_y 

*  Age

gen age =2001-born_y
drop if age<18 
count
gen agec= .
replace agec=1 if age<=24
replace agec=2 if age >=25 & age<30
replace agec=3 if age >=30 & age<35
replace agec=4 if age >=35 & age<40
replace agec=5 if age >=40 & age<45
replace agec=6 if age >=45
lab define agecl 1 "24-" 2 "25-29" 3 "30-34" 4 "35-39" 5 "40-44" 6 "45+"
lab values agec agecl

*  Education 

rename titstu educ
destring educ , replace
tab educ
label define educl  1 "no leggere" 2 "no titolo" 3 "elementari" 4 "medie" 5 "classico" 6 "scientifico" 7 "linguistico" 8 "artistico" ///
                    9 "professionale" 10 "magistrale" 11 "istituto arte" 12 "tecnico" 13 "magistrale" 14 "diploma non univ" 15 "diploma univ" 16 "laurea"  
lab values educ educl
gen high = educ>=5
lab var high "high school"
tab high

* Singles

rename staciv ms
lab var ms "marital status"
label define stato_civile 1 "celibe/nubile" 2 "coniugato" 3 "separato di fatto" 4 "separato legalmente" 5 "divorziato" 6 "vedovo"
lab values ms stato_civile
rename mmat m_marriage
rename amat y_marriage
tab ms
gen single= ms==1 | ms==4 | ms==5 | ms==6 // single sono celibi separati div e vedovi
tab single

*  Origin 

rename anntra italy_year
lab var italy_year "anno del trasferimento in italia"
rename pronas born_prov 
lab var born_prov "provincia nascita"
lab values born_prov codici_province
rename estnas born_country
lab values born_country cittadinanza
rename cittad nationality
lab define nat 1 "italiano" 2 "straniero"
lab values nationality nat
rename stac nationality2
lab var nationality2 "cittadinanza"
lab values nationality2 cittadinanza
codebook born_country
gen bc=0
replace bc= born_country if born_country!=.
replace bc= nationality2 if born_country==. & nationality2!=. // sg
lab var bc "individual country of origin and SG"
codebook bc
drop if bc==999 | bc==998 // apolidi 

gen nat= bc
merge m:1 nat using "$data\CodiciStatiEsteri.dta" , keepusing(EUII)
tab _merge
drop _merge
replace EUII=4 if nat==224 
replace EUII=4 if nat==258  
replace EUII=4 if nat==259  
replace EUII=4 if nat==260  
replace EUII=4 if nat==261  
replace EUII=6 if nat==317  
replace EUII=0 if nat==0  
rename EUII group
gen origin=.
replace origin=0 if group==0 
replace origin=1 if group==1
replace origin=2 if group==2 | group==3
replace origin=3 if group==4 
replace origin=4 if group==5 
replace origin=5 if group==6 
replace origin=6 if group==7 
replace origin=7 if group==8 
lab define lorigin 0 "italian" 1 "eu" 2 "eu10+eu2" 3 "euother" 4 "africa" 5 "asia" 6 "america" 7 "oecd"
lab values origin lorigin
drop if origin==.
drop nat

* Keep singles

keep if single==1
drop if age<18 
drop if age>61 
tab sex
gen female = sex==2
gen male =   sex==1
gen y = 2001

recode provincia ( 108 = 15) // change monza-brianza in MILANO
recode provincia ( 110 = 72) // change barletta-andria-trani e foggia in BARI 
recode provincia  ( 71 = 72)  
recode provincia ( 91 = 92 ) // change oristano, nuoro, olbia-tempio, ogliastra, medio-campidano, carbonia-iglesias in CAGLIARI
recode provincia ( 95 = 92 )
recode provincia ( 104 = 92 )
recode provincia ( 105 = 92 )
recode provincia ( 106 = 92 )
recode provincia ( 107 = 92 )

keep if provincia==15 | provincia==58 | provincia==1 | provincia==63 | provincia==82 | provincia==37 | provincia==48 | provincia==27 | provincia==32 | ///
        provincia==10 | provincia==79 | provincia==76 | provincia==66 | provincia==42 | provincia==70 | provincia==72 | provincia==92 | provincia==22 | ///
		provincia==54 | provincia==7 | provincia==17 | provincia==65  | provincia==87 | provincia==28 | provincia==16 | provincia==23

collapse (sum) male female , by( y provincia high origin agec ) 

save "$data\census2001_singledistribution.dta" , replace

preserve
keep if female==1
save "$data\census2001_femaledistribution.dta" , replace
export "$data\Singles_Women_Before.csv" , replace
restore

preserve
keep if male==1
save "$data\census2001_maledistribution.dta" , replace
export "$data\Singles_Men_Before.csv" , replace
restore



  
  
  
  
  